سیستم تشخیص خودکار زبان صحبت شده از روی گفتار
پایان نامه
- دانشگاه تربیت معلم - تهران - دانشکده مهندسی
- نویسنده شیما ح
- استاد راهنما منوچهر کلارستاقی فرشاد عشقی
- سال انتشار 1393
چکیده
تشخیص خودکار زبان در واقع مساله تشخیص زبان یک نمونه گفتار صحبت شده توسط سخنگوی نامعلوم است. تشخیص خودکار زبان میتواند به ارتباط بین مردم نواحی گوناگون کمک کند و کاربردهای مختلفی در توسعه گردشگری، تجارت آزاد، تقویت امنیت ملی از طریق پیشپردازش و فیلترنمودن مکالمات مشکوک، خدمات اورژانس، ترجمه همزمان در همایشها و مکالمات بینالمللی دارد. در این پایاننامه با کمک کلاسهبندی ویژگیهای مختلف، سیستم تشخیص خودکار زبان، طراحی و پیادهسازی شده است. ویژگیهای صوتی مورد نظر از فریمهای متوالی سیگنال گفتار استخراج و ویژگیهای آماری این فریمها به عنوان بردار ویژگی در نظر گرفته میشوند. برای این منظور ویژگیهای mfcc ، lpc وplp استخراج و مورد تجزیه و تحلیل قرا گرفته است. پس از استخراج این ویژگیها، لیفترهای خطی و غیر خطی به ضرایب اعمال میشود. همچنین ترکیب دو به دو این ویژگیها نیز برای تشخیص زبان استفاده شده است. بعد از استخراج ویژگیهای مورد نظر، توسط کلاسبند مدل مخلوط گوسی و همچنین اعمال روشllr به عنوان یک روش پسپردازش ساده، برای تصمیمگیری مناسبتر از روی بردارهای امتیازات بدست آمده، شناسایی زبان مورد نظر انجام میگیرد. نتایج آزمایشها نشان میدهد که ضرایب mfcc به همراه اعمال لیفتر غیر خطی و نیز ترکیب دو ویژگی میتواند کارایی سیستم را افزایش دهد. تاکنون روشهای مختلفی برای شناسایی زبان گفتاری پیشنهاد شده است، که در بین همه آنها ضرایب کپسترال به درصد صحت بالاتری رسیده است. نتایج نشانگر دقت مناسب اعمال لیفتر سینوسی به ضرایب و نیز ویژگیهای ترکیبی در تشخیص زبان میباشد.
منابع مشابه
انتخاب و مقایسة عملکرد ویژگیهای بهینة استخراجشده از سیگنال گفتار برای تشخیص خودکار بیماری پارکینسون
در سالهای اخیر، محققین تلاشهای زیادی برای تشخیص بیماری پارکینسون از طریق یافتن ارتباط آن با سیگنال گفتار افراد انجام دادهاند. همچنین پژوهشهایی در تعیین شدت بیماری و ارتباط آن با اختلالات صوتی انجام شده است. هدف این مقاله، ارزیابی و مقایسة توانایی دسته ویژگیهای مختلف استخراجی از سیگنال گفتار، در تشخیص بیماری پارکینسون است. برای این منظور، 12 دسته ویژگی از سیگنال گفتار ارزیابی شدهاند، تح...
متن کاملتشخیص خودکار سیگنالهای موسیقی و گفتار فارسی
با توجه به رشد روز افزون محتوای چند رسانه¬ای، زمینه¬های تحقیقاتی جدیدی همچون تحلیل محتوای صوتی جهت پردازش، تشخیص و دسته¬بندی داده¬ها بر اساس محتوا معرفی شده است. مسئله دسته¬بندی سیگنال هایِ گفتار و موسیقی که زیر مجموعه¬ای از این تحقیقاتِ جدید است، توسط محققان زیادی مورد توجه و بررسی قرار گرفته است. با این وجود، تاکنون الگوریتمی که بتواند در لحظه همانند سیستمِ شنوایی انسان عمل کرده و سیگنال¬های صوت...
15 صفحه اولشناسایی خودکار زبان گفتار با استفاده از روش های آماری
سیستم های شناسایی زبان بر دو گونه اند: سیستم هایی که از اطلاعات سطح بالای زبان مانند واج و کلمه برای شناسایی زبان استفاده می کنند و سیستم هایی که از اطلاعات سطح پایین زبان مثل زیرواج و یا ویژگی های طیفی گفتار استفاده می کنند. مشکل سیستم های با دقت بالا مانند سیستم های شناسایی زبان مبتنی بر واج که نیاز به استخراج واج دارند اینست که نیاز به دادگان آوانویسی شده برای آنها وجود دارد و با توجه به این...
15 صفحه اولبهبود نرخ تشخیص احساس از روی گفتار با استفاده از تفکیک جنسیتی
تشخیص احساس از روی سیگنال گفتار یکی از شاخههای نسبتاً جدید در پردازش گفتار میباشد که میتواند در تعامل انسان و روبات نقش مهمی ایفا کند. در این مقاله ضمن استفاده از دو نوع ویژگی طیفی جدید به منظور افزایش نرخ بازشناسی به بررسی تاثیر جنسیت گویندگان در تشخیص احساس پرداخته شده است. ویژگیهای یاد شده با استفاده از روشهای پردازش تصویر، از تصویر طیفنگاره سیگنال گفتار استخراج میشوند . در این تحقیق ب...
متن کاملتشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...
متن کاملاستخراج ویژگیهای مبتنی بر مدلسازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار
تحقیقات اخیر نشان میدهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار میتواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصههای تراژکتورهای گفتاری به ندرت در سیستمهای کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
دانشگاه تربیت معلم - تهران - دانشکده مهندسی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023